2004. 12. 『인문콘텐츠』 4


電子文化地圖 開發을 위한 情報編纂技術*1)


김  현**


1. 전자문화지도 개념의 도입

2. 기존 GIS 응용 기술의 문제점

3. 시․공간정보 개체의 관리 방법

4. XML 텍스트 상에서의 시․공간정보 처리

5. 시․공간정보의 활용을 위한 기술 개발 과제


1. 전자문화지도 개념의 도입


  역사․문화 분야의 자료를 데이터베이스화 함에 있어 그 텍스트 속에서 발견되는 시간․공간 관련 정보를 전자지도나 전자연표에 연결시켜서 보이려는 시도는 GIS 관련 기술의 발달에 힘입어 이미 우리 주변에서 상당히 일반화되었다고 할 수 있다. 하지만 그 대부분의 경우, 텍스트 속의 시․공간 개념을 정보 개체로 취급하지 않고, 텍스트의 특정 부분을 지도나 연표에 링크시키는 작업에만 치중하기 때문에 역사 문헌 속의 시․공간 정보는 더 이상의 심화된 지식 정보를 생산하는 데 활용되지 못하고 있다.

텍스트 상의 시․공간 정보를 전자지도나 전자연표에 링크시키는 것의 목적은 시각적 수단을 빌어 자료 이해의 효과를 높이는 데 그치는 것이 아니다. 개별적인 시․공간 정보 상호간의 관계를 도출함으로써 새로운 지식 정보를 생산하는 것이 궁극적인 목표라고 할 수 있다. 이러한 목표를 이루기 위해서는 텍스트와 시각 자료의 한 건 한 건을 연결하는 작업에 앞서 텍스트 내의 시․공간 개념을 정보의 한 단위로 취급할 수 있게 하고, 다각적인 방법으로 그 단위 정보에 접근할 수 있도록 하는, 보다 근본적인 시․공간 정보 관리 프레임워크의 개발이 필요하다.

“전자문화지도(電子文化地圖)”라고 하는 것은 역사․문화 관련 정보 자원 상호간의 “시․공간적 상호연계성”을 “전자지도”라는 시각적 표현 방법을 통해 드러내려는 방법이다.1) 필자는 이 글을 통해, 전자문화지도 개념의 데이터베이스 구축을 위해 역사 자료에 포함된 시간적, 공간적 정보를 기계가독형(機械可讀形)의 정보 요소로 표현하는 방법을 제시하고, 이러한 역사 자료 정보 처리 방안이 표준화된 디지털 역사 자료 기술규칙(記述規則)으로 발전하는 데 필요한 기술적 과제를 점검하고자 한다.


2. 기존 GIS 응용 기술의 문제점


  기존의 역사 자료 정보화에 응용되고 있는 GIS 관련 기술은 역사 자료 속의 시․공간 개념을 정보로서 다룬다기보다 텍스트의 특정 부분에서 시각적인 지도 도면으로의 링크를 가능하게 하는 수준에 머물고 있다. 전자문화지도 개념의 시․공간 정보 처리 방법을 논하기에 앞서 일반적인 역사․지리 정보 시스템의 구현 방법을 점검해 보기로 한다.

역사 문헌 속에 “광주군(廣州郡)”이라고 하는 지명, 또는 “남한산성 일대”라고 하는 지리적 표현이 포함되어 있고, 그 문헌을 전자화 하고자는 정보편찬자는 그것의 위치나 강역이 전자지도 상에 시각적으로 표현되기를 원한다고 가정해 보자. 이 때 편찬자는 일차적으로  “광주군”, “남한산성 일대”와 같은 어구에 그것이 지리적 정보임을 알리는 표시를 해 주어야 할 것이다. 이 작업은 XML DTD나 SCHEMA에서 미리 정의된 요소(要素,  element) 이름을 태그(tag) 형태로 본문 속에 기입하는 작업이다. 그러나 요소 태그의 기입만으로는 그것이 지리적 정보임이 표시될 뿐, 전자지도로의 링크가 자동적으로 이루어지지 않는다. 전자지도 상에서의 표시를 위한 속성(屬性, attribute) 정보를 첨가해 주어야 한다. 여기까지의 작업은 주로 역사 자료를 잘 이해하는 인문 분야 정보 편찬자들에 의해 이루어진다.

  XML 문서 텍스트 가운데 지리적 정보로 표시된 부분이  전자지도 상에서 시각적으로 표시될 수 있도록 하는 것은  GIS 관련 정보 기술자의 업무이다. 이들이 구현한 응용 프로그램은 텍스트상의 지리 정보 요소를 읽어 들인 후,  속성 정보 값을 식별하여 디지털화된 베이스 맵(Base Map) 위에 위치, 강역, 경로 등을 표시한다.

  XML 문서에 포함한 지리적 정보가 전자지도 상에서 표시되도록 하는 일반적인 과정은 이와 같이 정리할 수 있지만, 그 실제 작업은 결코 용이하지가 않다. 텍스트 편찬과 전자지도 구현의 매개 역할을 하는 “지리 정보 식별자”를 정의하는 데에 일정한 규칙이 없기 때문이다. 지리 정보 시스템만을 전문적으로 다루는 GIS 관련 기술자들은 전자지도 상에서의 위치 표시를 위한 식별자로서 경위도(經緯度) 좌표나, 적어도 그 경위도 좌표를 쉽게 얻어낼 수 있는 지번(地番)2)을 제공받기를 원한다. 그러나 사서나 고문서와 같은 역사 자료를 편찬하는 사람들이 특정 지역의 경위도 좌표나 지번을 알 방법이 없다. 더구나 “동막천 상류”나 “청계산 동쪽 사면”과 같이 모호한 범위의 자연 지역은 법정 지명 중심의 지번으로 표현하는 것이 불가능하다.

  그러한 문제를 안고서도, 부득이 텍스트 정보와 전자지도 사이의 연계 기능을 구현하기 위해 정보 편찬자들에게 특별히 개발된 응용 프로그램을 사용하도록 요구하는 경우가 있다. 즉 컴퓨터의 작업 화면에 XML 텍스트와 전자지도 베이스 맵을 동시에 띄워 놓은 후, 전자지도 상에서 점을 찍거나 도형을 작도한 후 그것을 관련 텍스트로 드래깅(dragging)하면 기계적으로 생성된 지리정보 식별자가 텍스트 데이터 안에 삽입되도록 하는 것이다.  철저히 프로그램 의존적인 이 방법에 대해 필자가 동의하지 않는 이유는 그렇게 해서 만들어진 데이터가 다른 종류의 시스템에서 작동하기 어렵기 때문이다.  즉, 그 작업을 수행한 응용 프로그램 상에서는 텍스트와 전자지도 사이의 연계가 완벽하게 이루어진다고 해도 그 매개 경로가 은폐되어 있고, 특정 시스템에 의존적이기 때문에 데이터의 독립성이 보장되지 않는다. 결국 그 데이터를 다른 시스템에서 활용할 수 없게 되고, 오래도록 여러 사람에 의해 유지 발전되어야 할 소중한 역사 정보 데이터가 수명이 짧은 특정 응용 프로그램과 생명 주기를 같이 하는 안타까운 일이 발생하기도 하는 것이다.

기존의 역사 자료에 대한 GIS 응용 기술이 안고 있는 문제점은 역사 자료 속의 정보 요소를 체계적으로 관리하는 노력이 선행되지 않은 채 디지털화된 정보의 서비스 차원에서만 GIS와의 접목을 시도한 데서 온 것이라고 할 수 있다. 역사 자료 속의 시․공간 정보가 단순히 전자지도나 전자연표 링크 기능의 제공뿐 아니라 개별적 역사 자료의 상호간의 시․공간적 연계성을 찾는 매개 기능까지도 수행할 수 있게 하기 위해서는 역사 자료의 텍스트 속에서 만나는 시․공간 개념을 정보 개체로 다룰 수 있는 방법이 찾아져야 한다.


3. 시․공간정보 개체의 관리 방법


  전자문화지도 개념의 정보 데이터베이스는 다양한 종류의 정보 자원들이 서로간의 시간․공간적 관계에 따라 연계하여 활용될 수 있도록 하는 데 목적이 있다. 즉, 인물 정보, 유물 정보, 사건 정보, 문학․음악․예술작품 정보 등 여러 종류의 정보 자원이 독립적으로 축적된 가운데, 특정 지역 또는 특정 시간대에 속하는 모든 정보를 그것의 유형의 구분 없이 상호 연계하여 활용할 수 있도록 하자는 것이다.

  이러한 기능의 정보 데이터베이스는 그 속에 들어갈 모든 정보 자원에 대해, 정보 콘텐트 편찬자와  GIS 개발자 모두가 공동으로 사용할 수 있는 표준화된 형식의 “공간 코드”나 “시간 코드”를 부여함으로써 구현할 수 있다. 하지만 이 방법이 현실적으로 가능하지 않은 이유는 역사․문화 분야의 다양한 연구 자료에 보편적으로 적용할 시․공간 코드를 설계하는 것이 용이하지 않기 때문이다. 이 문제에 대한 해결 방법이 장기적인 “전자문화지도” 콘텐트 편찬 사업에 의해 지속적으로 추진되어야 한다는 전제하에, 필자는 다음과 같은 단계적인 해결 방법을 제시하고자 한다.


① 역사․문화 자료에 포함된, 그 영역이 불명확한 시․공간 정보를 명확하게 규정하려 하기보다 “불명확한 개념” 그 자체를 하나의 개체로 간주하는 사고방식을 도입한다.

② 불명확하게 정의된 시․공간 개체를 모두 포섭하는 집합을 상정하고, 개별 시․공간 정보를 그 집합의 요소로 파악한다.

③ 시간 요소 집합, 또는 공간 요소 집합의 개별 요소는 미리 정의하지 않고, 역사 문화 자원 콘텐트를 개발하는 과정에 수시로 발생시켜서, 모집합의 요소로 등록해 나아간다.

④ 모집합에 등록된 요소의 상호관계(동치 관계, 완전한 포함 관계, 부분적인 포함 또는 교섭 관계 등)를 정의하는 연구를 지속적으로 수행함으로 그 상호관계의 종합적인 구조를 점진적으로 발전시켜 간다.


1) 공간 정보 레지스트리


  예를 들어 우리가 다루고자 하는 역사 문화 자원 가운데 다음과 같은 공간 정보가 포함되어 있다고 가정하자.


中部地方, 畿湖地域, 京畿道, 漢江 以南 地域, 서울 近郊, 城南市, 廣州郡, 盆唐新都市, 淸溪山 一帶, 炭川 上流 地域 .....


 만일 이러한 식으로 기술된 지역 범주를 측정 가능한 공간 요소3)로 완벽하게 분해할 수 있다면 각 지역간의 상호 관계를 명확하게 정의할 수 있을 것이다. 그러나 그것이 불가능하기 때문에  현단계에서는 분석되지 않은 공간 개념, “한강 이남 지역”, “서울 근교”와 같은 불명확한 범주 그 자체를  “공간적 개체”로 인식하고, 이를 정보로서 관리하자는 것이다.

  명확한 개념이라고 하더라도 그것이 정보로 관리되기 위해서는 그것을 등록하고 참조하고 재활용할 수 있게 하는 일종의 등기부(登記簿, registry)가 필요하다. 정보 편찬 과정에서 발견되는 시․공간 개념을 그때 그때 이 등기부에 등록하고, 등록된 개체를 역사 자료의 관련 기사에 연결시켜 놓으면, 차후에 이 등기부에 등록된 개체 상호간의 관계를 규정함으로써 그 개체에 연결된 모든 정보 자원의 시․공간적 관계를 기계적으로 생성할 수 있게 된다.

  등기부에 등록된 개체들의 상호 관계를 만들어 내기 위한 중간 과정으로서, 각각의 개체가 의미하는 시․공간적 범위를 전자적인 지도상에 도형으로 표시하는 방법을 고려할 수 있다. 언어적 서술로 규정하기 어려운 시․공간 요소의 영역을 가상적인 평면 위의 도형 형태로 표현한다면, 보다 용이하게 그 요소간의 관계를 구상화(具象化)할 수 있기 때문이다. 그러한 이유에서 필자는 시․공간 정보 레지스트리를  “전자지도” 관리 시스템과 연계하여 운영하는 방법을 제안한다.

  전자지도 참조 기능을 겸한, 지리정보 레지스트리의 구조는 다음과 같다.


□ 공간정보 레지스트리 구조

공간정보 개체 식별자

ID

개체 유형

Type

시간 한정

Time Limits

설명

Description

전자지도

오브젝트

Objects

유관 개체와의 관계

Relation

(복수 지정)

관계

관련 개체

 

 

 

 

 

 

 

 

 

 

 

 

 

 


- 개체식별자: 콘텐트 개발자에 이해 승인된 공간정보 개체의 고유한 이름

- 개체 유형: 해당 공간정보 개체가 “특정 지물의 소재지”인지 “행정구역”인지, “자연지역”인지 또는 “동적경로”인지 등을 표시한다.

- 시간 한정: 해당 공간 정보 개체가 유효성을 갖는 시간적 범위에 대한 기술. 이 항목의 데이터는 시간정보 레지스트리에 등록된 “시간정보 개체 식별자”를 가지고 기술한다.

- 설명: 해당 개체에 대한 주석. 전자지도 오브젝트 작도를 위한 지침을 포함할 수 있다.

- 전자지도 오브젝트: 해당 공간정보 개체를 전자지도상에 표시하기 위한 정보.

- 관계: 동치(同値, EQ), 귀속(歸屬, BT), 교섭(交涉, PE) 등 해당 개체와 관련 개체 사이의 관계.

- 관련 개체: : 해당 개체와 관련 있는 다른 개체의 식별자

  ex) 동일한 공간정보 개체의 이칭․별칭이 등록될 때 그것의 대표항목을 지시


  위에 제시한 레지스트리 항목 가운데 ‘개체 식별자’, ‘개체 유형’, ‘시간 한정’, ‘설명’ 등은 역사 자료 콘텐트 편찬자들이 기술하며, ‘전자지도 오브젝트’는 GIS(Geographic Information System) 관리자가 ‘설명’ 항목에서 지시된 내용에 따라 GML(Geographic Mark-Up Language)로 기술한다. 지리정보 오브젝트는 “모호한 위치” 또는 “모호한 강역”의 경우 그 “모호성”이 표시되도록 한다.4) 또한 해당 공간정보 개체를 전자지도상에 표시할 때 가상적인 중심점을 보이기 위한 중심 좌표를 포함하도록 하는데, 이는 해당 기사 내용을 상징하는 아이콘의 표시 위치로 활용하기 위해서이다. 마지막 항목인 ‘관계’와 ‘관련 개체’는 공간정보 온톨로지(Ontology) 개발을 위해 고려한 것이며, 초기 단계의 레지스트리 구축에 필수적으로 요구되는 것은 아니다. 단, 기등록된 개체와 지리적으로 동치 관계에 있는 새로운 개체가 등록될 때에는 이곳에서 관련 개체를 지시해 줌으로써 ‘전자지도 오브젝트’를 중복적으로 기술하는 것을 생략할 수 있다.


2) 시간정보 레지스트리


  시간정보 개념 역시 공간정보 개념과 마찬가지로 그 범위가 명확하지 않은 것이 많이 있다.


武臣執權期, 麗末鮮初, 朝鮮時代, 朝鮮初期, 朝鮮前期, 宣祖1年, 1592年, 壬辰倭亂, 英․正年間 .....


  이상과 같이 다양한 역사적 시간 개념을 일정한 기준에 의해 구상화하고 그 개념들간의 상호 관계를 정하는 과제 역시 공간정보의 경우와 마찬가지로 레지스트리를 구축하고 그래픽적인 방법을 활용하는 것이 유용하다.

  공간 개념이 전자지도 상의 도형으로 표시될 수 있듯이 시간 개념은 불완전하게나마 연표라고 하는 시각 자료 위에 표현하는 것이 가능하다. 이 연표라고 하는 가상의 선분 또는 평면 위에 다양한 개별적 시간 개념의 범위를 표시해 나아가면 그 개념들 상호간의 관계가 파악될 수 있을 것이다.


□ 시간정보 레지스트리 구조

시간정보 개체 식별자

ID

개체 유형

Type

공간 한정

Space Limits

설명

Description

전자연표

오브젝트

Objects

유관 개체와의 관계

Relation

(복수 지정)

관계

관련 개체

 

 

 

 

 

 

 

 

 

 

 

 

 

 


- 개체식별자: 콘텐츠 개발자에 이해 승인된 시간정보 개체의 고유한 이름

- 개체 유형: 해당 시간정보 개체가 캘린더적 시간 개념(세기, 년, 월, 일 등으로 표시되는 기간)인지 역사적 시대 구분인지 또는 특정 사건을 중심으로 한 시간 개념인지, 인물의 생존기간인지 등을 표시

- 공간 한정: 해당 시간정보 개체가 유효성을 갖는 공간적 범위에 대한 기술. 이 항목의 데이터는 공간정보 레지스트리에 등록된 “공간정보 개체 식별자”를 가지고 기술한다.

- 설명: 해당 개체에 대한 주석. 등록 개체의 시간 범위를 명확히 해 주는  년, 월, 일 등의 일자 또는 기간을 이 항목에 부기해 줄 수 있다. 전자연표 오브젝트 작도를 위한 지침으로 활용된다.

- 전자연표 오브젝트: 해당 시간정보 개체를 전자연표 상에 표시하기 위한 정보.

- 관계: 해당 개체와 관련 개체 사이의 관계.

- 관련 개체: : 해당 개체와 관련 있는 다른 개체의 식별자

 

  시간정보 레지스트리에서의 ‘전자연표 오브젝트’라는 것은 시각적으로 형상화된 연표(Time Line) 상의 시점(Starting Point)과 종점(Ending Point)을 표시하는 GML 오브젝트를 가리킨다. 시각적 연표는  전자지도와 마찬가지로 GIS(Geographic Information System) 상에서 제작하며, 시간 연장 표시 오브젝트는 기본 측정 단위(예를 들어 연 단위 또는 월, 일 단위)로 구획할 수 없는 “모호한 시점”의 표시를 위한 요소를 포함한다.5)


4. XML 텍스트 상에서의 시․공간정보 처리


  시․공간 정보 레지스리에 등록된 시․공간 개체를 역사․문화 자료의 특정 부분에 링크시킴으로써 그 자료가 갖는 시간성, 공간성의 연계 활용이 가능해진다.  역사 자료 본문의 특정 부분을 시․공간 정보화 하는 것은  그 자료를 전자화한 XML 문서상에서 “<공간>” 및 “<시간>”과 같은 이름의 “표기 요소(標記要素, Mark Element)”6)의 지정을 통해 이루어질 수 있다. 이 요소의 기능에 대한 정의와 속성은 다음과 같다.


- <공간>: 지리적 공간에 관련된 정보임을 표시


  <!ELEMENT 공간 (#PCDATA)>

  <!ATTLIST 공간

        유형 #REQUIRED

        식별자 #REQUIRED

  >


- <시간>: 연대기적 시간에 관련된 정보임을 표시


  <!ELEMENT 시간 (#PCDATA)>

  <!ATTLIST 시간

        유형 #REQUIRED

        식별자 #REQUIRED

  >


요소

Element

속성 Attribute

비고

Remark

하위 요소

Sub Elements

유형

Type

식별자

Identifier

공간

해당 공간이 무엇에 관련된 것인가: 인물,  동식물, 특산물, 명승, 사적 등

콘텐츠 개발자에 이해 승인된 공간 정보 개체의 고유한 이름

- 식별자를 매개로 공간정보 레지스트리 연결

- 유형 값에 의해 전자지도상의 표시 아이콘 형태 지정

구조적 요소: 없음

표기적 요소: 가능

시간

해당 시간이 무엇에 관련된 것인가: 인물, 정부, 제도 사건 등

시간 정보 개체의 고유한 이름

- 식별자를 매개로 시간정보 레지스트리 연결

- 유형 값에 의해 전자연표 상의 표시 아이콘 형태 지정

구조적 요소: 없음

표기적 요소: 가능


  역사 자료 XML 텍스트에 레지스트리 등록 개체를 활용한 <공간> 및 <시간> 요소 태깅을 포함시키면 텍스트 상의 공간 정보를 “전자지도”라고 하는 시각적 자료와 바로 연계시키고, 시간 정보 역시 “전자연표”에 곧바로 링크되도록 하는, 이른 바 “멀티미디어 데이터 연계 기능”을 용이하게 구현할 수 있다.7) 다음은 <공간> 및 <시간> 요소 태깅의 예시이다.


<시간 유형=“사건” 식별자=“탄금대 전투"><인명 유형=“성명”>신립(申砬)</인명>, <공간 유형=“전적지” 식별자=“충주 탄금대”><지명 유형=“고을”>충주(忠州)</지명> <시각자료 유형=“정지화상” 식별자=“탄금대사진001”><지명 유형=“시설”>탄금대(彈琴臺)</지명></시각자료></공간>에서 <지명 유형=“국명”>왜</지명>군에게 저항하다.</시간>


위와 같이 태깅된 XML 문서는 응용 프로그램을 통해 아래 그림에서 보이는 바와 같이 하여 본문 속의 시간, 공간 정보에서 전자연표 및 전자지도로의 링크 링크 기능을 구현하게 된다.



  시․공간 정보 레지스트리의 구축과 병행하여 역사 자료의 전자 텍스트 상에서 그 레지스트리 등록 정보를 이용한 “<공간>” 요소와 “<시간>” 요소의 표시가 이루어지게 되면, 텍스트와 멀티미디어 데이터 연계가 가능할 뿐 아니라 더 나아가 역사 자료 텍스트의 여러 곳에 산재한 다양한 시․공간 정보 상호간의 관련성도 기계적으로 분석해 내는 일이 가능해진다. 텍스트 상에 언어적으로 표현된 시․공간 개념을 불완전하게나마 그 범위를 정량화할 수 있는 전자적 시․공간 정보(GIS Object)로 치환함으로써 시․공간 개체간의 상호 관계를 기계적으로 규정할 수 있는 방법이 열리게 되는 것이다. 또한 시․공간 정보 개체간의 상호 관계가 어느선까지 기계적으로 규정될 수 있다면 그 개체를 포함하는 역사 자료 텍스트 상호관의 시․공간적 연관 관계를 탐색하는 것도 가능해진다.

  시․공간 정보 레지스트리의 구축과 그 정보를 이용한 텍스트 데이터의 마크업 작업은 시간적으로 선․후 관계에 있는 것이 아니라, 동시에 추진되어야 하는 성격의 작업이라고 할 수 있다. 텍스트 데이터의 마크업 작업을 수행하는 과정에서 레지스트리에 등록해야 할 새로운 시․공간 개체를 발견할 수 있기 때문이다. 전자문화지도 개념의 역사 정보 콘텐트 개발 방법을 실무에 적용한 한국정신문화연구원의 “향토문화전자대전” 개발 사업에서는 이 두 가지 과업을 다음과 같은 형태로 병행하였다. 8)


① 보편적으로 쓰이고 있는 시간, 공간 개념을 조사하여 시간정보 레지스트리와 공간정보 레지스트리의 초기 DB를 구축

② 정보 콘텐트 편찬자들은 역사 자료의 XML 마크업 작업을 수행하는 과정에서 의미 있는 시․공간 정보를 발견할 때마다 그것이 레지스트리에 기등록된 정보인지를 확인

③ 기등록 정보인 경우에는 요소(Element) 표기와 함께 속성(Attribute) 정보로서 레지스트리 상의 개체 식별자를 기입

④ 레지스트리에 등록되지 않은 새로운 시․공간 정보인 경우에는 식별자를 명명하고 이를 레지스트리 관리자에게 통보

⑤ 레지스트리 관리자는 새로운 시․공간 개체를 레지스트리에 등록하고 전자지도 및 전자연표 상에서의 표시를 위한 GML 오브젝트를 생성


5. 시․공간정보의 활용을 위한 기술 개발 과제


  최근 들어 정보 시스템 상에서 유통되는 데이터 중 시․청각 자료의 비중이 높아지면서 문자 데이터의 정밀한 가공에 대한 관심과 노력이 약화되고 있는 것이 사실이지만, 정보 시스템상의 데이터가 전자적 아카이빙 기능만을 수행하는 것이 아니라 새로운 지식 생산의 소재가 되기 위해서는 인간의 사유의 흔적을 담은 문자 데이터의 활용도를 극대화시키는 노력을 간과해서는 안된다. 그리고  원문 텍스트의 구조와 의미를 충실히 담은 데이터베이스를 구현한 다음 그것을 보다 발전된 지식 생산의 도구로 활용하기 위해서는 그 속에 담긴 정보 요소들 간의  상호 연계성을 밝혀 줄 수 있는 장치를 마련하는 일이 필요하다.

  공간정보 레지스트리와 시간정보 레지스트리의 운영의 통해 시․공간 정보를 개체화하여 관리하는 것이 전자문화지도 개념의 역사․문화 정보 개발을 위한 첫 단계라고 한다면, 그 다음에 이어져야 할 노력은 레지스트리에 등록된 시․공간 정보의 상호 연계성을 기계적으로 탐색해 내는 기술을 개발하는 것이다.

  “경기도 광주군”과 “남한산성 일대” 등 두 공간정보는 밀접한 연관 관계가 있지만, 어구 분석만의 방법으로 이들의 연관성을 찾아내는 것은 불가능하다. 대안은 두 가지로 생각할 수 있다. 첫 번째는 각각의 공간개념에 대해 표준화된 지리정보 온톨로지(Ontology)의 술어를 사용하는 주석(Annotation)을 부가하고 그 주석문에 쓰인 술어를 분석함으로써 양자의 관계를 규명하는 것이다. 필자가 제안하는 두 번째 방법은 각각의 공간정보를 전자지도상에 표시할 때 쓰이는  언어(GML, Geographic Mark-Up Language)분석하여 양자의 관계를 규명하자는 것이다.9)

  GML을 사용함에 있어서 여러 공간정보들 사이의  영역 비교가 가능하도록  하는 것은 단순히 전자지도상의 위치 표시를 하는 것보다 훨씬 복잡하고 정교한 기술 과정을 필요로 한다. 하지만 여러 단계의 하위 오브젝트를 미리 설계․구현해 두고 그것을 상위 오브젝트에서 사용하는 방식을 취한다면 GIS 작업의 난이도는 그다지 부담스럽지 않은 수준으로 개선될 수 있다. 이 경우 우선적으로 탐구되어야 할 과제는 역사적 공간정보 및 시간정보를 전자지도 (또는 전자연표) 상에 시각적으로 표현할 뿐 아니라 그 개체 상호간의 관계를 탐색할 수 있게 하기 위해서는 어떠한 의미를 담은 하위 오브젝트가 필요한지 결정하는 일이다.  이 문제의 답은 실제의 역사․문화 관련 데이타를 가지고 시․공간 정보 레지스트리를 구축하면서 하나 하나의 개체를  GML 오브젝트로 구현해 가는 과정을 통해 찾아져야 할 것이다.


주제어: 전자문화지도, 정보편찬기술, 시간정보 공간정보 레지스트리, 모호성, 지리정보시스템



[Abstract]


Information Compilation Technology

for the Electronic Cultural Atlas Databases


Hyeon Kim


  Electronic Cultural Atlas in this paper means a newly invented multi-media database compilation method. The aim of this new method is to reveal the time-spacial relations among various historical or cultural information resources by using electronic visualization technology of Geographic Information System(GIS). 

  These days, GIS technology is doing an important role when we implement information systems on historical or cultural materials. However the GIS application in this area still has many problems. System developers  usually place too much emphasis on the linkage between a certain part of text and a graphical object of electronic maps; but they often neglect the fact that time-spacial relation among various parts of the text is more important for the historical and cultural studies.

  The purpose of hypertext linking between cultural information text and electronic map objects is not only to enhance the display effects but also to produce new knowledge resources by extract the mutual relations among various time-spacial expressions included in the text data. To accomplish this goal, we should set up a sort of time-space information management framework where we can handle the various time-spacial  entities as units of knowledge information and provide various access methods to those units.

  I propose a framework of a time-space object registry in this paper. If a database compiler registers historical terms which have chronological or geographical meaning according to this registry management methodology,  those registered items can be used to extract and analyze the time-spacial relations among the various historical records.


Key Words: electronic cultural atlas, information compilation technology, registry for time-spacial information entity, ambiguity, XML, GIS, GML




 * 이 논문의 내용은 2002년도 한국학술진흥재단의 지원에 의하여 연구된 것임.

   (KRF-2002-074-BL1071)

** 한국학중앙연구원(구 정신문화연구원) 한국학대학원 인문정보학 교수, 인문정보학연구실장. 「인문 콘텐츠를 위한 정보학 연구 추진 방향」,  「디지털 정보 시대의 인문학」,  「인문정보학에 관한 구상」,  『국역 조선왕조실록 데이터베이스 CD-ROM』 등.


1) “전자문화지도”는 미국 UC 버클리대를 중심으로 이루어지고 있는 ECAI(Electronic Cultural Atlas Initiative, 세계전자문화지도협의회) 활동에서 차용한 개념이다.  ECAI는 불교 고문서들을 전자화하자는 취지에서 만들어진 ‘전자불교문헌협의회’(EBTI)에서 비롯됐는데, 불교 문헌을 정보화는 과정에서 각종 불상 이미지, 지도 등의 자료를 정보화는 업무가 발생했고, 이것은 결국 박물관에 있는 모든 문화자료로 그 범위가 넓혀졌다. 이러한 과정을 통해 ECAI는 지리정보시스템(GIS)을 이용하여 여러 곳에 산재한 문화 자원 정보를 효과적으로 활용하는 기술의 개발, 이를 위한 표준화 등에 관심을 기울이게 되었으며, 1996년부터 매년 이 주제에 대한 국제회의를 개최하여 인문사회 및 정보기술 전문가들의 관심과 역량을 결집시켜 가고 있다.

     필자가 본고에서 언급하는 “전자문화지도”는 역사․문화 분야의 문헌 정보 자료 속에 담긴 시․공간 정보의 상호 관계를 지리정보시스템(GIS)과 같은 정보기술(Information Technology)을 이용하여 규명하고 활용할 수 있게 하는, 기능적으로 확장된 역사․문화 정보 데이터베이스를 의미한다.


2) 땅의 일정한 구획을 나타내기 위해 매겨 놓은 번호. 행정 단위, 번지, 호수 등으로 구성되어 있다. 현재 국내 대부분의 시(市)․군(郡) 주거 지역에 대한 지적(地籍) 데이터베이스가 구축되어 있기 있기 때문에 지번을 알면 해당 위치의 경위도 좌표를 바로 알 수 있다.


3) 예를 들면, 동(洞), 면(面), 군(郡)과 같은 행정 단위, 또는 경위도 좌표로 표시되는 물리적 공간


4) 예를 들어 각주 “경기도 광주군”과 “경기도 광주군 일대”를 각각 전자지도 상에서 표시할 때 공간 범위는 동일한 모양으로 그린다고 해도 후자는 전자에 비해 그 지리적 공간의 불명확성 내지는 모호성을 띠고 있다고 하는 의미를 GML 오브젝트 상에 담도록 한다는 것이다. 이는 향후 공간정보 개체들 사이의 관계(동치, 귀속, 교섭 등)를 기계적으로 도출하는 데 필요하다.


5) 시간적 “모호성”(ambiguity)의 표현: 역사적 공간 개념을 개체화 하여 전자지도 상에 표시할 때나, 시간 개념을 개체화 하여 시각적 연표 상에 표시할 때 반드시 강구해야 할 과제는 역사적 시․공간 개념어가 부득이하게 수반하고 있는 “모호성”을 어떻게 표현해 줄 것이냐 하는 것이다. 예컨대 “1392년부터 1592년 사이의 기간”이라고 하면 비교적 명확하게 그 시간 연장의 시작과 끝이 (1년을 단위 요소로 하는) 연표상에 시각적으로 형상화될 수 있지만, “14세기말에서 15세기말”이라고 표현된 시간 연장은 시점과 종점 모두 상당한 모호성을 띠고 있다. 이 때, 이와 같이 언어적으로 모호하게 표현된 부분을 굳이 명확하게 분석하려 하지 말고, 모호한 부분을 포함하는 시간 개념 그 자체를 하나의 시간정보 개체로 간주하자는 것이 필자가 제안하는 시․공간 정보 관리의 방법이다. 모호한 것과 명확한 것만 구분하거나, 더 나아가더라도 어느 정도 모호한지를 기술하는 데 머물자는 것이다. 이 모호성의 등급에 대해서는 구체적인 데이터 작업을 수반한 심화 연구에서 다루기로 한다.


6) XML 문서의 구성 요소(Element) 중에는 “<문서>”, “<제목>”, “<본문>”, “<문단>”과 같이 상위 요소의 구조적 구성 인자로 쓰이는 것이 있는가 하면, “<인명>”, “<지명>”, <서명>“, ”<주석>“과 같이 문장 속에 포함된 특정 문구의 성격을  표시해 주는 요소가 있다.  필자는 이러한 두 종류의  XML  엘리먼트를 각각 ”구조 요소(構造要素, Structural Element)“와 ”표기 요소(標記要素, Mark Element)로 구분하고자 한다.

   - 구조 요소(構造要素, Structural Element): 상위 요소의 구성 인자 역할을 하는 요소

   - 표기 요소(標記要素, Mark Element): 문자 데이터 중간에 삽입되어 특정 어휘 또는 어절에 대한 표기 기능을 수행하는 요소

   원래 W3C의 XML 표준안에서는 XML 엘리먼트에 대해 구조 요소와 표기 요소의 구분을 두지 않는다. 하지만 역사 사료에서 빈번하게 쓰이는 표기적 요소들은 여러 가지 면에서 일반적인 XML 엘리먼트들과 다른 특징을 가지고 있으므로 이를 구분하여 다루고자 한다.


7) 앞에서 설명한 공간정보 및 시간정보 레지스트리”의 일차적인 용도는 역사․문화 자료 속에서 실제로 쓰이는 다양한 시․공간 개념의 목록을 만드는 것이지만, 이것은 역사 문화 정보 콘텐츠에 포함된 각각의 시․공간 정보를 전자연표나 전자지도 상에 표시될 수 있도록 하는 “시각자료 참조” 기능을 효율적으로 구현하는 방법으로도 응용될 수 있다. 즉, 정보 편찬자들은 지리적 요소에 대해 경위도좌표나 지번 대신 역사 용어에 근거한 식별자를 부여함으로써 XML 태깅을 용이하게 할 수 있고, GIS 개발자들은 그들이 이해하기 어려운 역사 문헌 텍스트를 직접 다룰 필요 없이 레지스트리와 전자지도 사이의 연계 기능만을 구현하면 되기 때문이다. 이 점에서 시․공간 정보 레지스트리는 텍스트와 전자지도 사이의 매개 역할 뿐 아니라, 인문 분야 정보 편찬자와 기술 분야 개발자 사이의 매개 역할을 수행한다고도 할 수 있다.


8) 시․공간 정보 레지스트리를 매개로 역사 자료 속의 시간 공간 정보를 전자연표 및 전자지도와 연계시키는 방법은 고려대학교 민족문화연구원에서 수행한 “조선시대 전자문화지도 개발 및 그 응용 연구”(2002. 8. - 2004. 7.)의 일환으로 연구되었으며, 그 성과는 한국정신문화연구원 한국학정보센터에서 수행하는 “한국향토문화전자대전” 개발 사업에 실제적으로 적용되고 있다. 2005년 3월에 개발 완료될 예정인 “성남 지역 향토문화대전”은 경기도 성남 지역 향토 문화 정보 콘텐트 속에 담긴 모든 시간․공간 정보를 정보 요소화 하고 이를 전자연표 및 전자지도와 연계하여 표현하는 기능을 포함하고 있다.


9) GML로 기술된 위치 및 영역 표시값이 공간정보 레지스리트레 등록되었을 경우, 그것의 활용 방법은 다양하게 이루어질 수 있겠지만 가장 대표적인 활용 예로서 특정 공간정보와 지리적으로 인접 관계에 있는 다른 공간정보들을 탐색해 내는 작업을 상정해 본다면 그것은 다음과 같은 형태로 이루어질 수 있을 것이다.

   - 레지스트리에 등록된 GML을 공간 영역 값으로 치환하여 두 개체간의 일치 여부를 분석하는 검색 프로그램을 구동한다.

   - 특정 공간정보 개체 A와 탐색범위 R을 검색 키워드로 지정한다.

   - 검색 프로그램은 검색된 공간정보 개체 각각에 대해 개체명과 관계 유형(동치, 귀속, 포섭, 교섭, 인접 등)을 반환한다.